半年後にAIはいったいどうなっているのか 2024年上半期
正直さっぱりわかりませんnomadoor.icon
無いと思うけれどStable Diffuisonがデファクトスタンダードから降りるかもしれない
LoRAとかControlNetが流用できるようになるか、ゼロショットのIP-Adapterのような技術が出る必要もある
画像生成AIにMLLMを組み込む
処理速度的に多分無理
DePINはインフラをブロックチェーンで維持しようと試みるもの
画像生成AIを作るのに使われるデータセットの権利問題は登場当初からずっとある
画像の学習権利を売るというのとRWAという概念は相性よさそうじゃない?
これが広まるとはまったく思わないけれども()
ロボットへの組み込み
ロボットを作りたかった人間なのでまた盛り上がってて嬉しい
ただ、みんなハードウェアから作ってるのがちょっと気になる
日本はハードウェアにこだわるのに対して、アメリカはロボット自体はAtlasを使ってソフトウェアの方で改良を繰り返すから進歩が早いよねみたいなものを10年前に読んだ気がする
ASIMOオープンソースにしません?(適当)
これを忘れていた
ComfyUIのworkflowはjsonで表せるので、これをGPTsに食わせればプロンプトに応じて動的にworkflowを組んでくれる(はず)
オールインワンモデルを作るよりも、内部でいろんなツールを組み合わせて絵を作らせる方がいいものができる
copilotの方が近いかも
ComfyScriptはworkflowをPythonのコードにできるのでLLMにとってはより読みやすい
総評
ほぼなにも観測せず上半期終わったのですがなにか革命ありましたか…?nomadoor.icon
だれか教えて~!takker.icon
2024/8/25 RSSリーダーに溜まってたものは大体見終わったのでnomadoor.icon
Sora以降は朝起きたら世界変わってる技術はなかった感じかな
動画生成AI・Gen-3すごい
Soraレベルにこんなに早く追いつくとは思わなかった
Runwayがそこまで稼げているイメージが全くないのだけど、技術がすごいのかちゃんとお金を集められているのか…
LLMは着実に進化
OpenAIが社内のゴタゴタで動いていないのもあるけれど、meta、googleその他が代わる代わるトップ争いをしていて良い感じ
8bくらいの大きさで初期GPT-4レベルに使えるLLMが増えてきたので、そろそろローカル完結のアプリケーション、ゲームが増えてくるかも
MicrosoftのCopilot搭載PC然り
Flux vs SD3
本当にStable Diffusionが一線から退いてしまうのかどうなのか
AIだけで儲かる手段はさほどないというのがバレてきている気がする
ComfyUIの開発・コミュニティーが安定してきた
初期と変わらぬ開発のスピード感を保ちつつ、個人開発からグループでの開発に移行できているようで安心
OpenArtのようにComfyUIを中心においた企業が出てきたり、英語圏・中国圏ではイベントが開催されたり、無限の解説動画があったりで盛り上がりを感じる 日本は……わかんないです(´・ω・`)